AI资讯新闻榜单内容搜索-Kimi K2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Kimi K2
第一性原理视角下的MoE推理的经济学分析

第一性原理视角下的MoE推理的经济学分析

第一性原理视角下的MoE推理的经济学分析

随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家(MoE)模型的相继发布,它们已成为智能前沿领域大语言模型(LLM)的领先架构。由于其庞大的规模(1万亿参数及以上)和稀疏计算模式(每个token仅激活部分参数而非整个模型),MoE式LLM对推理工作负载提出了重大挑战,显著改变了底层的推理经济学。

来自主题: AI技术研报
5473 点击    2025-09-03 11:22
每月20元!智谱GLM-4.5杀入Claude Code,开启编程API“包月”时代

每月20元!智谱GLM-4.5杀入Claude Code,开启编程API“包月”时代

每月20元!智谱GLM-4.5杀入Claude Code,开启编程API“包月”时代

这段时间 AI 编程的热度完全没退,一个原因是国内接连推出开源了不少针对编程优化的大模型,主打长上下文、Agent 智能体、工具调用,几乎成了标配,成了 Claude Code 的国产替代,比如 GLM-4.5、DeepSeek V3.1、Kimi K2。

来自主题: AI资讯
6402 点击    2025-09-02 11:41
硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。

来自主题: AI技术研报
6331 点击    2025-08-08 11:52
战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2被喊冤

战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2被喊冤

战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2被喊冤

最新战报最新战报:首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。 是的,谷歌给大模型整了个国际象棋比赛:Kaggle AI象棋竞赛。

来自主题: AI资讯
5512 点击    2025-08-07 10:42
万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

从GPT-2到DeepSeek-V3和Kimi K2,架构看似未变,却藏着哪些微妙升级?本文深入剖析2025年顶级开源模型的创新技术,揭示滑动窗口注意力、MoE和NoPE如何重塑效率与性能。

来自主题: AI技术研报
6342 点击    2025-08-04 12:05
无惧封禁!Cursor最佳国产平替诞生,彻底告别代码泄露风险

无惧封禁!Cursor最佳国产平替诞生,彻底告别代码泄露风险

无惧封禁!Cursor最佳国产平替诞生,彻底告别代码泄露风险

Cursor突然断供,码农AI Coding就像被砍掉了手脚!如今,清华系最强平替MonkeyCode站在了C位,不仅性能炸裂、成本超低,还能应对复杂编程任务,首发支持Kimi K2和Qwen3。

来自主题: AI资讯
5816 点击    2025-07-25 13:00
开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

编程Agent王座,国产开源模型拿下了!就在刚刚,阿里通义大模型团队开源Qwen3-Coder,直接刷新AI编程SOTA——不仅在开源界超过DeepSeek V3和Kimi K2,连业界标杆、闭源的Claude Sonnet 4都比下去了。

来自主题: AI资讯
8219 点击    2025-07-23 09:09
Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

开源大模型正在进入中国时间。 Kimi K2风头正盛,然而不到一周,Qwen3就迎来最新升级,235B总参数量仅占Kimi K2 1T规模的四分之一。 基准测试性能上却超越了Kimi K2。

来自主题: AI资讯
5915 点击    2025-07-22 15:02